Analisis

En esta hoja de trabajo se generaran dos modelos de redes neuronales que sean capaces de clasificar usando la variable de respuesta que categoriza las casas en baratas, medias y caras. Estos modelos tendran diferentes topologias y funciones de activacion. Estos modelos se utilizaran para predecir la variable de respuesta. Asimismo, se realizaran las matrices de confucion y se compararan los resultados. Seguido de esto, se realizara el mismo proceso pero para la variable SalesPrice, de manera que el algoritmo prediga el precio de las casas.

Red Neuronal con caret

A continuacion se muestra el modelo generado con caret:

## Neural Network 
## 
## 1005 samples
##   36 predictor
## 
## Pre-processing: scaled (36), centered (36) 
## Resampling: Bootstrapped (25 reps) 
## Summary of sample sizes: 1005, 1005, 1005, 1005, 1005, 1005, ... 
## Resampling results across tuning parameters:
## 
##   size  decay  RMSE       Rsquared   MAE      
##   1     0e+00  0.3907485  0.7622808  0.2769931
##   1     1e-04  0.3918450  0.7612514  0.2753927
##   1     1e-01  0.3783910  0.7779488  0.2669289
##   3     0e+00  0.4639380  0.6845588  0.2627924
##   3     1e-04  0.4538665  0.6977134  0.2652302
##   3     1e-01  0.4119560  0.7432752  0.2643202
##   5     0e+00  0.5618630  0.6099531  0.3083380
##   5     1e-04  0.5727794  0.6095714  0.3217542
##   5     1e-01  0.4391807  0.7175722  0.2927027
## 
## RMSE was used to select the optimal model using the smallest value.
## The final values used for the model were size = 1 and decay = 0.1.

Seguido de esto vemos la prediccion y su matriz de confusion:

## Confusion Matrix and Statistics
## 
##    
##       3   2   1
##   3 107  12   0
##   2  16 114   9
##   1   0  24 149
## 
## Overall Statistics
##                                         
##                Accuracy : 0.8585        
##                  95% CI : (0.8219, 0.89)
##     No Information Rate : 0.3666        
##     P-Value [Acc > NIR] : < 2.2e-16     
##                                         
##                   Kappa : 0.7861        
##                                         
##  Mcnemar's Test P-Value : NA            
## 
## Statistics by Class:
## 
##                      Class: 3 Class: 2 Class: 1
## Sensitivity            0.8699   0.7600   0.9430
## Specificity            0.9610   0.9110   0.9121
## Pos Pred Value         0.8992   0.8201   0.8613
## Neg Pred Value         0.9487   0.8767   0.9651
## Prevalence             0.2854   0.3480   0.3666
## Detection Rate         0.2483   0.2645   0.3457
## Detection Prevalence   0.2761   0.3225   0.4014
## Balanced Accuracy      0.9155   0.8355   0.9276

Red Neuronal con NNet

A continuacion se muestra el modelo generado con NNet:

## # weights:  951
## initial  value 5031.726971 
## iter  10 value 637.344651
## iter  20 value 418.319770
## iter  30 value 380.523953
## iter  40 value 359.563226
## iter  50 value 353.961363
## iter  60 value 349.629284
## iter  70 value 347.159325
## iter  80 value 345.745372
## iter  90 value 344.567672
## iter 100 value 343.870690
## iter 110 value 343.676592
## iter 120 value 341.483413
## iter 130 value 326.198745
## iter 140 value 316.714176
## iter 150 value 310.232274
## iter 160 value 288.008201
## iter 170 value 244.586163
## iter 180 value 230.158380
## iter 190 value 222.209036
## iter 200 value 216.589345
## iter 210 value 213.145943
## iter 220 value 201.923250
## iter 230 value 158.295899
## iter 240 value 126.279922
## iter 250 value 117.794434
## iter 260 value 117.527846
## iter 270 value 117.525356
## iter 280 value 117.494324
## iter 290 value 117.490541
## iter 300 value 117.489091
## final  value 117.489091 
## stopped after 300 iterations

Seguido de esto vemos la prediccion y su matriz de confusion:

## Confusion Matrix and Statistics
## 
##    
##       3   2   1
##   3 106  12   0
##   2  17 114   9
##   1   0  24 149
## 
## Overall Statistics
##                                           
##                Accuracy : 0.8561          
##                  95% CI : (0.8194, 0.8879)
##     No Information Rate : 0.3666          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.7826          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: 3 Class: 2 Class: 1
## Sensitivity            0.8618   0.7600   0.9430
## Specificity            0.9610   0.9075   0.9121
## Pos Pred Value         0.8983   0.8143   0.8613
## Neg Pred Value         0.9457   0.8763   0.9651
## Prevalence             0.2854   0.3480   0.3666
## Detection Rate         0.2459   0.2645   0.3457
## Detection Prevalence   0.2738   0.3248   0.4014
## Balanced Accuracy      0.9114   0.8337   0.9276

Comparacion de Resultados con otros modelos de clasificacion

Matríz de confusión Naive Bayes

Matríz de confusión Regression Lineal

Matríz de confusión Arbol de Clasificación

Matríz de confusión SVM

  • Modelos Lineales
  • Modelos Radiales
  • Modelos Polinomiales

Debajo tenemos una grafica comparativa del Accuracy obtenido de los modelos utilizados para las predicciones: